Baseball Reference (簡稱:BR) 是在 2000 年由 Sean Forman 在他讀博士期間所建立的棒球數據網站。後來 2004 年 Forman 又創立了 Sports Reference 公司,建立除了棒球以外,還有美國其他四大運動的網站,像是籃球的 Basketball Reference。
BR 的特色就是他的資料庫十分齊全,只要是棒球相關的資料都有可能從裡面獲得資料,不管是小聯盟的資料,或是包含各國的職業聯盟資料,甚至是中華職棒的資料也能從裡面獲得。
2023 中職頁面:2023 Chinese Professional Baseball League | Baseball-Reference.com
另外就是很古老之前的資料,遠自 1888 年的球員資料都能獲得,想要找歷史紀錄、歷屆獎項獲得者與其的數據,或是球隊的累積數據,都能從 BR 裡面取得。
歷屆賽揚獎得主:https://www.baseball-reference.com/awards/cya.shtml
BR 的另一個特色,就是他簡約的風格,沒什麼花俏的 UI 與圖表,只有簡單的表格與大量的連結,所以操作十分簡單,但有時候能用的連結太多,會一時迷失方向或是點到非預期的連結,或是一時找不到自己想要的數據,所以使用的時候還請多注意。
pybaseball 使用這個頁面來獲得打者與投手資料,使用方法很簡單,一開始先選擇要看打擊 (Batting Game Logs) 或是投球 (Pitching Game Logs),再來可以到日期 (Dates) 區域選擇想要的時間範圍。這邊要注意一點的是,BR 會一次去撈時間區間內所有的球員資料,所以如果選的範圍太大可能會花很長的時間然後 Timeout。
可在網頁上用的時間選項:
選完時間就可以按 Get Results 搜尋球員資料。
搜尋完的資料會有球員的基本數據,還有距離上一次上場有多少天 (#days),然後可以點欄位做排序。
範例九月 OPS 前十名:
各大聯盟球隊的歷史資料,可以透過點選球隊名稱進去球隊頁面。pybaseball 使用了隊伍頁面的球季頁來獲得選取球季的所有球員資料,可以透過下面連結查看有甚麼內容。
2023 響尾蛇球員資料:
2023 Arizona Diamondbacks Statistics | Baseball-Reference.com
可以看到除了打者與投手資料,往下拉還能看到有現在的 40 人名單,守位擔任次數與薪水等許多資料,實在太多資料一時介紹不完。
在球員頁面,會有一個 Splits 的選項,可以獲得球員的分項資料,可以選取各球季或是生涯的資料,這邊用張育成為例子。
裡面會有各種不同種類的數據可供大家參考,像是對決不同慣用手的成績,月份成績,主客場成績,不同球數下的成績,還有遇到先發投手第幾輪的成績,總共有 24 種項目,十分豐富多元,是分析一個球員的好地方。
今天簡單介紹了 Baseball Reference,以及 pybaseball 會使用的頁面,感謝大家耐心地看完。老實說今天介紹的在 BR 龐大的資料庫裡只是小小的一部分,裡面還有很多很有趣的資料,很值得大家花時間研究。明天接下來就會來介紹 pybaseball 裡面的 functions,一樣會從打擊的部分開始。